وفقی سازی الگوریتم نزدیکترین همسایه برای دسته بندی داده های جریانی

thesis
abstract

امروزه در بسیاری از کاربرد ها، جریان داده به سرعت و در حجم زیاد تولید می شود. یکی از روش های با اهمیت در کاوش داده، دسته بندی آن است. از چالش های مهم دسته بندی جریان داده، تغییر مفهوم داده با گذشت زمان است که نیاز به، به روز رسانی مدل دسته بندی را مطرح می کند. تاکنون بسیاری از روش های سنتی دسته بندی داده برای تعامل با جریان داده بهبود داده شده اند. یکی از این الگوریتم های سنتی یادگیری، الگوریتم نزدیکترین همسایه است که یکی از الگوریتم های جذاب حوزه داده کاوی است. الگوریتم نزدیکترین همسایه با توجه به مکانیزم ساده تصمیم گیری در تحقیقات گذشته بسیار مورد توجه قرار گرفته است. این الگوریتم برای دسته بندی داده های جریانی با مشکلاتی مواجه خواهد شد که یکی از این مشکلات حجم نمونه ها است. ضمنا تعیین تعداد همسایه ها نیز برای تصمیم گیری این الگوریتم چالش برانگیز است. در این رساله دسته بندی جدیدی مبتنی بر الگوریتم نزدیکترین همسایه پیشنهاد شده است. مدل افزایشی این دسته بندی کننده، برای دسته بندی جریان داده بکار رفته است. سرعت مناسب یادگیری، انعطاف پذیری در زمان پاسخ و پایداری در برابر اغتشاش از مزایای این روش افزایشی هستند. دقت روش پیشنهادی با روش-های شناخته شده در این حوزه روی مجموعه داده های استاندارد واقعی و مصنوعی مقایسه شده است. نتایج بدست آمده حاکی از بهبود دقت، زمان و حافظه در روش افزایشی پیشنهادی است

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

ارزیابی عملکرد رهیافت توسعه یافته‌ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه

مولدهای هواشناسی (Weather Generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته‌اند. الگوریتم‌های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده‌اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده‌ها در س...

full text

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

full text

بهینه سازی گروه ذرات به روی پارامترهای کرنل و k نزدیکترین همسایه برای مسائل دسته بندی

در این پایان نامه یک روش حل مسائل دسته بندی ارائه می شود. کرنلها در روشهای حل مسائل دسته بندی کاربرد بسیاری دارند. با استفاده از کرنل، داده ها به فضایی با ابعاد بالاتر انتقال داده می شوند. به طور ایده آل انتظار می رود که در این فضا داده های مشابه در کنار یکدیگر قرار بگیرند. نو آوری این پایان نامه در به کار گرفتن روش دسته بندی k نزدیکترین همسایه در این فضا است. این عمل از نظر تئوری عملکرد مناس...

سیستم های دسته بندی فازی برای داده های جریانی

سیستم های خودگستر فازی روش هایی قدرتمند در جهت دسته بندی جریان های داده می باشند. در این سیستم ها، قوانین فازی به صورت خودکار تولید، به روز رسانی و حذف می گردند. با این حال، الگوریتم های معرفی شده تا این زمان نمی توانند به خوبی با مشکلات تغییر ناگهانی و تغییر تدریجی در مفهوم داده ها مقابله نماید. در این پایان نامه دو روش خودگستر آن لاین جهت دسته بندی جریان های داده معرفی شده اند، که بر خلاف روش...

15 صفحه اول

دسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها

در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...

full text

ارزیابی عملکرد رهیافت توسعه یافته ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه

مولدهای هواشناسی (weather generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته اند. الگوریتم های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده ها در س...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023